|
|
| Acesso ao texto completo restrito à biblioteca da Embrapa Agricultura Digital. Para informações adicionais entre em contato com cnptia.biblioteca@embrapa.br. |
Registro Completo |
Biblioteca(s): |
Embrapa Agricultura Digital. |
Data corrente: |
23/12/1998 |
Data da última atualização: |
20/01/2020 |
Autoria: |
NASCIMENTO, M. A.; CUNHA, A. C. R. da. |
Afiliação: |
MARIO A. NASCIMENTO, CNPTIA; ADRIANO C. R. DA CUNHA, IC/UNICAMP. |
Título: |
An experiment stemming non-traditional text. |
Ano de publicação: |
1998 |
Fonte/Imprenta: |
In: STRING PROCESSING AND INFORMATION RETRIEVAL: A SOUTH AMERICAN SYMPOSIUM, 1998, Santa Cruz de la Sierra. Proceedings... Los Alamitos: IEEE Computer Society, 1998. |
Páginas: |
p. 75-80. |
DOI: |
10.1109/SPIRE.1998.712985 |
Idioma: |
Inglês |
Conteúdo: |
Stemming is a technique which aims to extract common suffixes of words. Thus, words which are literally different but have a commom stem, may be abstracted by their common stem. The underlying goal when using a stemming techniques is to improve recall, at the possible expense of precision loss. A well known technique for stemming text is Porter's algorithm, which is based on a set of rules extracted from the English language. In this paper, we argue that such an algorithm it is not efficient for non-traditional texts, e.g., one made up mainly of medical terms. We thus investigate the use of a technique, called Peak-and-Plateau, which is based on tries, and compare it to Porter's algorithm. Our experiments have shown that using Porter's algorithm or none at all makes no difference as far as precision and recall goes. On the other hand, using the Peak-and Plateau technique we improved recall by about 15% and decreased precision by an average of 40%. Moreover, it compressed the original text by 40% and the inverted file by 45%. |
Palavras-Chave: |
Recuperação de informação; Stemming. |
Thesaurus Nal: |
Information retrieval. |
Categoria do assunto: |
-- |
Marc: |
LEADER 01695nam a2200181 a 4500 001 1006876 005 2020-01-20 008 1998 bl uuuu u00u1 u #d 024 7 $a10.1109/SPIRE.1998.712985$2DOI 100 1 $aNASCIMENTO, M. A. 245 $aAn experiment stemming non-traditional text.$h[electronic resource] 260 $aIn: STRING PROCESSING AND INFORMATION RETRIEVAL: A SOUTH AMERICAN SYMPOSIUM, 1998, Santa Cruz de la Sierra. Proceedings... Los Alamitos: IEEE Computer Society$c1998 300 $ap. 75-80. 520 $aStemming is a technique which aims to extract common suffixes of words. Thus, words which are literally different but have a commom stem, may be abstracted by their common stem. The underlying goal when using a stemming techniques is to improve recall, at the possible expense of precision loss. A well known technique for stemming text is Porter's algorithm, which is based on a set of rules extracted from the English language. In this paper, we argue that such an algorithm it is not efficient for non-traditional texts, e.g., one made up mainly of medical terms. We thus investigate the use of a technique, called Peak-and-Plateau, which is based on tries, and compare it to Porter's algorithm. Our experiments have shown that using Porter's algorithm or none at all makes no difference as far as precision and recall goes. On the other hand, using the Peak-and Plateau technique we improved recall by about 15% and decreased precision by an average of 40%. Moreover, it compressed the original text by 40% and the inverted file by 45%. 650 $aInformation retrieval 653 $aRecuperação de informação 653 $aStemming 700 1 $aCUNHA, A. C. R. da
Download
Esconder MarcMostrar Marc Completo |
Registro original: |
Embrapa Agricultura Digital (CNPTIA) |
|
Biblioteca |
ID |
Origem |
Tipo/Formato |
Classificação |
Cutter |
Registro |
Volume |
Status |
URL |
Voltar
|
|
Registro Completo
Biblioteca(s): |
Embrapa Milho e Sorgo. |
Data corrente: |
30/01/2008 |
Data da última atualização: |
15/02/2023 |
Tipo da produção científica: |
Orientação de Tese de Pós-Graduação |
Autoria: |
ALMEIDA, R. V. de. |
Afiliação: |
Ramon Vinícius de Almeida. |
Título: |
Parâmetros genéticos e alterações nas frequencias alélicas em três ciclos de seleção divergente para tolerância ao alumínio em milho. |
Ano de publicação: |
2007 |
Fonte/Imprenta: |
2007. |
Páginas: |
51 f. |
Idioma: |
Português |
Notas: |
Dissertação (Mestrado em Genética e Melhoramento) - Universidade Federal de Viçosa, Viçosa, MG.
Coorientadores: Jurandir Vieira de Magalhães e Claudia Teixeira Guimarães. |
Conteúdo: |
A toxicidade ao alumínio (AI) é um dos maiores problemas para a agricultura em solos ácidos, que ocupam grandes áreas agricultáveis no mundo. Em condições de baixo pH associado a estes solos, o Al3+ é solubilizado e se torna tóxico para as plantas, inibindo o crescimento de suas raízes e comprometendo a produtividade das culturas. Genótipos adaptados aos solos ácidos podem oferecer uma solução sustentável a este problema. Os objetivos deste trabalho foram (1) estimar parâmetros e ganhos genéticos obtidos ao longo de três ciclos de seleção divergente para a tolerância e (2) identificar alterações nas freqüências alélicas em cinco locos próximos a um QTL no cromossomo 5 do milho que explica 13% da tolerância ao AI. O índice fenotípico empregado, foi o Crescimento Liquido Relativo (CLR) obtido a partir do cultivo em solução nutritiva. Marcadores microssatélites (SSR) foram utilizados para detectar desequilíbrio de ligação entre as marcas e o QTL. Ocorreu um ganho genético expressivo da população base à primeira geração de 45%, diminuindo drasticamente para os ciclos posteriores. Tal evidência é patente de caráter de herança oligogênica. A utilização do CLRi (crescimento liquido relativo em nível de plantas) pode levar a inferências errôneas quanto a classificação de genótipos para tolerância ao AI. Variações nas freqüências alélicas em 4 locos, na primeira geração, e em todos os locos, na segunda geração, foram explicadas exclusivamente pela deriva genética. |
Palavras-Chave: |
Tolerancia. |
Thesagro: |
Alumínio; Milho. |
Categoria do assunto: |
-- |
URL: |
https://ainfo.cnptia.embrapa.br/digital/bitstream/item/194166/1/Jurandir-dissertacao-Ramon.pdf
|
Marc: |
LEADER 02221nam a2200169 a 4500 001 1488905 005 2023-02-15 008 2007 bl uuuu m 00u1 u #d 100 1 $aALMEIDA, R. V. de 245 $aParâmetros genéticos e alterações nas frequencias alélicas em três ciclos de seleção divergente para tolerância ao alumínio em milho.$h[electronic resource] 260 $a2007.$c2007 300 $a51 f. 500 $aDissertação (Mestrado em Genética e Melhoramento) - Universidade Federal de Viçosa, Viçosa, MG. Coorientadores: Jurandir Vieira de Magalhães e Claudia Teixeira Guimarães. 520 $aA toxicidade ao alumínio (AI) é um dos maiores problemas para a agricultura em solos ácidos, que ocupam grandes áreas agricultáveis no mundo. Em condições de baixo pH associado a estes solos, o Al3+ é solubilizado e se torna tóxico para as plantas, inibindo o crescimento de suas raízes e comprometendo a produtividade das culturas. Genótipos adaptados aos solos ácidos podem oferecer uma solução sustentável a este problema. Os objetivos deste trabalho foram (1) estimar parâmetros e ganhos genéticos obtidos ao longo de três ciclos de seleção divergente para a tolerância e (2) identificar alterações nas freqüências alélicas em cinco locos próximos a um QTL no cromossomo 5 do milho que explica 13% da tolerância ao AI. O índice fenotípico empregado, foi o Crescimento Liquido Relativo (CLR) obtido a partir do cultivo em solução nutritiva. Marcadores microssatélites (SSR) foram utilizados para detectar desequilíbrio de ligação entre as marcas e o QTL. Ocorreu um ganho genético expressivo da população base à primeira geração de 45%, diminuindo drasticamente para os ciclos posteriores. Tal evidência é patente de caráter de herança oligogênica. A utilização do CLRi (crescimento liquido relativo em nível de plantas) pode levar a inferências errôneas quanto a classificação de genótipos para tolerância ao AI. Variações nas freqüências alélicas em 4 locos, na primeira geração, e em todos os locos, na segunda geração, foram explicadas exclusivamente pela deriva genética. 650 $aAlumínio 650 $aMilho 653 $aTolerancia
Download
Esconder MarcMostrar Marc Completo |
Registro original: |
Embrapa Milho e Sorgo (CNPMS) |
|
Biblioteca |
ID |
Origem |
Tipo/Formato |
Classificação |
Cutter |
Registro |
Volume |
Status |
Fechar
|
Nenhum registro encontrado para a expressão de busca informada. |
|
|